AI资讯新闻榜单内容搜索-LLaMA

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

来自主题: AI资讯

11238 点击 2025-04-06 12:15

刚刚，奥特曼接连抛出重磅消息：GPT-5不仅将免费开放，还将整合多项尖端技术。o3和o4-mini即将在几周内亮相，还有一个神秘的开源推理模型要来。然而，另一边Meta的Llama 4却因性能瓶颈屡次延期，AI竞赛的格局愈发扑朔迷离。

来自主题: AI资讯

10179 点击 2025-04-05 15:13

Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职，她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaCon AI大会前夕，引发业内对Meta战略调整和未来新作的诸多猜测。

来自主题: AI资讯

11138 点击 2025-04-05 01:09

最近，AI 公司 Databricks 推出了一种新的调优方法 TAO，只需要输入数据，无需标注数据即可完成。更令人惊喜的是，TAO 在性能上甚至超过了基于标注数据的监督微调。

来自主题: AI技术研报

9589 点击 2025-03-30 14:33

在 2024 年七月的一篇博客文章中，Meta CEO 马克·扎克伯格表示，“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”

来自主题: AI资讯

11699 点击 2025-03-24 10:52

马克·扎克伯格今年正在提升 Meta 人工智能的语音功能，准备从这项快速发展技术中创收。

来自主题: AI资讯

11254 点击 2025-03-10 14:37

虽然 Qwen「天生」就会检查自己的答案并修正错误。但找到原理之后，我们也能让 Llama 学会自我改进。

来自主题: AI技术研报

8618 点击 2025-03-06 09:37

近年来，大语言模型（LLMs）取得了突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报

9459 点击 2025-02-17 14:37

2024年11月，艾伦人工智能研究所（Ai2）推出了Tülu 3 8B和70B，在性能上超越了同等参数的Llama 3.1 Instruct版本，并在长达82页的论文中公布其训练细节，训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报

7906 点击 2025-02-05 16:54

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯

8923 点击 2025-02-05 11:19